package com.atguigu.gmall.realtime.util;

import org.wltea.analyzer.core.IKSegmenter;
import org.wltea.analyzer.core.Lexeme;

import java.io.IOException;
import java.io.StringReader;
import java.util.HashSet;
import java.util.Set;

/**
 * @Author lizhenchao@atguigu.cn
 * @Date 2021/10/13 10:11
 */
public class IkUtil {
    
    public static void main(String[] args) {
        System.out.println(split("我是中国人"));
    }
    
    public static Set<String> split(String keyword) {
        HashSet<String> words = new HashSet<>();
        // 字符串->字符输入流
        // 内存流
        StringReader reader = new StringReader(keyword);
        // smart  _maxword
        IKSegmenter segmenter = new IKSegmenter(reader, true);
        // 小米手机
        try {
            Lexeme next = segmenter.next();
            while (next != null) {
                
                String word = next.getLexemeText();
                
                words.add(word);
                next = segmenter.next();
            }
        } catch (IOException e) {
            e.printStackTrace();
        }
        
        return words;
    }
}
/*
手机  小米手机

我是中国人
 我 是 中国人
 
我 是 中国 国人 中国人

 */